[文献阅读] A Game-Theoretic Approach to Computation Offloading in Satellite Edge Computing 卫星边缘计算中计算卸载的博弈方法

发表于 2022-03-29 更新于 2022-04-20 收录于文献阅读

提出了一个计算卸载游戏框架，以排队论为优化性能的指标，计算了任务的响应时间和能耗，并提出了一种迭代算法来找到纳什均衡。

摘要与主要贡献

提出了卫星边缘计算中计算卸载策略优化的博弈论方法，建立了一个计算卸载博弈框架，并基于排队论计算了任务的响应时间和能量消耗，作为优化性能的度量。提出了一种迭代算法来搜索博弈的纳什平衡。表明基于游戏的卸载策略可以大大降低设备的平均成本。
考虑到卫星引起的间歇性通信，只有在窗口期才能够进行通信，并假设卫星上只部署一个MEC服务器
KPI：响应时延与能耗

系统模型

应用场景

drawing

一组远程地面设备位于一个小的固定区域，一组卫星在轨道上。任务可以在设备上本地执行，也可以通过卫星-地面通信卸载到部署在卫星上的边缘计算服务器上。由于间歇性的地面-卫星通信，设备在任何时候都不能将任务卸载到卫星上，即只有在卫星飞越时才会卸载任务。

drawing

将边缘计算场景抽象为左图，不可移动设备记为N={1,2,…,N},有覆盖区域卫星记为M={1,2,…M},由于星上资源有限，我们假设卫星上只部署了一台边缘计算服务器。显然，如果所有任务都在设备上本地执行或卸载到卫星上，则等待执行的时间和队列中的功耗将大幅增加。因此，需要对每个设备的计算卸载策略进行优化，以提高性能。

轨道模型

根据仰角𝛼的正负，正就是可以通信，负无法通信,假设地面的设备距离很近，他们在一个固定的很小的区域内，因此它们与卫星的几何关系相同。

>定义一个（轨道）周期内的通信时间 >𝜃={𝜃1,𝜃2,...𝜃𝑀},0≤𝜃𝑗≤1 >𝜃𝑗表示设备在轨道周期内可以与卫星j通信的时间的百分比。

通信模型

只考虑上传时间，忽略返回结果的下载时间（结果数据远远小于上传数据）

移动设备i到卫星j的上行链路数据速率𝑅𝑖,𝑗

R_{i, j} = B \log_{2} (1 + \frac{p_{i} g_{i, j}}{σ_{0} + \sum_{s \in N_{, s \neq i}} p_{s} g_{s, j}})

B表示信道带宽，Pi表示设备i的发射功率，𝑔𝑖,𝑗表示设备i与卫星j之间的信道增益，σ0表示背景噪声功率

可以得知 * 任务的传输速率𝑅𝑖,𝑗与设备的发射功率𝑃𝑖成正相关 * 过高的发射功率𝑃𝑖会导致过多的能量消耗 * 过多设备的卸载，将导致速率降低

计算模型

假设每个移动设备可以生成一系列同类任务。设备i生成的任务可以用所需的资源和数据大小来表示，即 Taski = {ci，di},$𝐶_{(𝑚)}^{𝑖}$和$𝐶_{(𝑠)}^{𝑗}$是设备和卫星的计算能力，为随机变量，用一秒CPU周期数表示。均值表示为$\bar{(𝑐_𝑖)}$,$\bar{(𝑑_𝑖)}$，二阶矩为$\bar{(c_𝑖^2)}$ 和$\bar{(d_𝑖^2 )}$ 设备i在本地执行并和分流到卫星的任务的百分比定义为设备i的计算分流策略 𝐱𝑖={𝑥𝑖,0,𝑥𝑖,1...𝑥𝑖,𝑀}

约束条件 * 百分比大于0（0表示不往该设备卸载） * 所有的百分比相加为1 * 隐含：每个都要小于1

博弈论模型

令𝑋=𝑋1∗𝑋2∗...𝑋𝑁是所有设备策略组合的集合,所有设备的整体策略我们可以用𝐱={𝐱1,𝐱2,…,𝐱𝑁} 表示，中间的𝐱𝐢表示设备i的策略 $𝐱_{−𝐢}=({𝐱_{1},...𝐱_{𝑖−1},𝐱_{𝑖+1}…,𝐱_{𝑁}})∈𝑋$表示除玩家𝑖以外的所有玩家策略的向量 KPI(性能指标)选择平均响应时间和平均功耗作为性能指标，成本函数计算如下 $P_{𝑖}(𝑥_{𝑖}, 𝑥_{(−𝑖)}) = 𝑇_{𝑖} + 𝜇_{𝑖}𝐸_{𝑖}$

一个典型的博弈论问题。要优化的目标函数不仅与其策略有关，而且与其他参与者策略有关。

计算任务卸载到卫星

卸载的平均响应时间

计算任务从移动设备i分流到卫星j，需要执行三个步骤：卸载任务，在卫星上执行，返回结果由于卫星的高动态性，i不能总是和j通信，因此需要考虑通信的等待时间卸载的平均响应时间

> 个人思考：要是卫星刚好快离开通信区域时任务才卸载，那等结果返回时应该是要加上一个卫星的周期，此公式并不严谨卫星轨道引起的等待时间与设备i到卫星j通信的时间百分比有关，通信百分比为𝜃𝑗，卸载平均等待时间和平均等待结果返回时间为

$𝑇𝑗≫T_(𝑖,𝑗)^sat+ T_(𝑖,𝑗)^{(𝑤𝑞𝑢𝑒)}$, 𝑇𝑗是卫星j的轨道周期

个人思考：不是很明白这两个公式的含义，如果算平均时间，根据均值定理（8）公式分母应该是上标-下标，（9）公式同理

根据M/G/1排队理论，卫星j上任务的平均排队等待时间为

>采用M/G/1排队模型，使用p-k公式计算平均等待时间总式子

### 卸载到卫星的能耗由$E_{(𝑖,𝑗)}^{𝑡𝑟𝑎𝑛𝑠}$平均传输消耗， $E_{(𝑖,𝑗)}^{sat}$平均处理消耗

E_{i, j}^{trans} = p_{i} T_{i, j}^{trans} = \frac{p_{i} \bar{d}}{R_{i, j}}

$𝑃_{𝑖}$为i的传输消耗由于CPU的能耗与CPU的频率的平方成正比，得

E_{i, j}^{s a t} = κ {(C_{j}^{(s)})}^{2} \bar{c}

其中κ是取决于芯片架构的有效开关电容总式子

E_{i, j} = E_{i, j}^{trans} + E_{i, j}^{s a t} = \frac{p_{i} \bar{d}}{R_{i, j}} + κ {(C_{j}^{(s)})}^{2} \bar{c}

分流到本地执行

同样采用M/G/1排队模型执行任务的平均响应时间$𝑇_{(𝑖,0)}$ = 在i上的平均等待时间$T_{(𝑖,0)}^{(𝑤𝑞𝑢𝑒)}$ + 平均执行时间$T_{(𝑖,0)}^{loc}$ 执行时延

T_{i, 0}^{l o c} = \frac{\bar{c}}{C_{i}^{(m)}}

本地排队时延

T_{i, 0}^{l o c} = \frac{\bar{c}}{C_{i}^{(m)}} T_{i, 0}^{wait} = \frac{λ_{i}}{2 (1 - ρ_{i})} \frac{\bar{c^{2}}}{{(C_{i}^{(m)})}^{2}} = \frac{x_{i, 0} λ_{i} \bar{c^{2}}}{2 (C_{i}^{(m)} - x_{i, 0} λ_{i} \bar{c}) C_{i}^{(m)}}

本地排队时延

T_{i, 0} = T_{i, 0}^{w - q u e} + T_{i, 0}^{l o c} = \frac{x_{i, 0} λ_{i} \bar{c^{2}}}{2 (C_{i}^{(m)} - x_{i, 0} λ_{i} \bar{c}) C_{i}^{(m)}} + \frac{\bar{c}}{C_{i}^{(m)}}

能耗

E_{i, 0} = κ {(C_{i}^{(m)})}^{2} \bar{c}

其中κ是取决于芯片架构的有效开关电容

总式子

时延

T_{i} = x_{i, 0} (T_{i, 0}^{wait} + T_{i, 0}^{l o c}) + \sum_{j = 1}^{M} x_{i, j} T_{i, j}

能耗

E_{i} = x_{i, 0} E_{i, 0} + \sum_{j = 1}^{M} x_{i, j} E_{i, j}

纳什均衡的证明和唯一性证明

在博弈中，如果每个参与者在已知其他参与者的策略下，采用最优策略来应付，那么我们就达到了一个纳什均衡，同时也意味着没有人能通过改变自己的策略，获得更好的结果。

占优策略 * 在选择策略时，有一个策略的效用总是大于其他所有策略的效用时，我们把这类策略称为占优策略。占优策略纳什均衡 * 当所有参与者的最优回应时选择他们的占优策略时，这时达到的纳什均衡称为占优策略。

定理1

非合作博弈，至少存在一个纳什均衡 * 条件1:策略空间$𝑋_{𝑖}$是欧几里得空间的非空，凸且紧凑的子集 * 条件2:成本函数$P_{𝑖}$($𝑥_{𝑖}$, $𝑥_{−𝑖}$)连续且在$𝑋_{𝑖}$为凸

定理2

一个连续的二次可微函数P(x)，其中x = (x1, x2，…xM)当且仅当其二阶偏导数的Hessian矩阵为正定时，为凸。

H (P (x)) = {[\frac{\partial^{2} P}{\partial x_{i} \partial x_{j}}]}_{M \times M}

黑塞矩阵

H (f) = [\begin{array}{cccc} \frac{\partial^{2} f}{\partial x_{1}^{2}} & \frac{\partial^{2} f}{\partial x_{1} \partial x_{2}} & \dots & \frac{\partial^{2} f}{\partial x_{1} \partial x_{n}} \\ \frac{\partial^{2} f}{\partial x_{2} \partial x_{1}} & \frac{\partial^{2} f}{\partial x_{2}^{2}} & \dots & \frac{\partial^{2} f}{\partial x_{2} \partial x_{n}} \\ ⋮ & ⋮ & ⋱ & ⋮ \\ \frac{\partial^{2} f}{\partial x_{n} \partial x_{1}} & \frac{\partial^{2} f}{\partial x_{n} \partial x_{2}} & \dots & \frac{\partial^{2} f}{\partial x_{n}^{2}} \end{array}]

计算

H (P_{i} (x_{i}, x_{- i})) = {[\frac{\partial^{2} P_{i}}{\partial x_{i, j} \partial x_{i, k}}]}_{(M + 1) \times (M + 1)}

为正定矩阵，根据定理2位凸根据式子

\sum_{\begin{matrix} k = 1, 2, \dots M \\ k \neq j \end{matrix}} | \frac{\partial^{2} P_{i}}{\partial x_{i, j} \partial x_{i, k}} | = 0 < | \frac{\partial^{2} P_{i}}{\partial x_{i, j}^{2}} |, \forall i \in N

证明其是占优可解且纳什均衡唯一

算法

初始分布为$𝑥_{𝑖}= (1/(M+1), 1/(M+1), …, 1/(M+1))$

在每次迭代中，每个设备都会搜索当前情况下的最优卸载策略$𝑥_{𝑖}^{,}$,和计算最小代价函数$P_𝑖(𝑥_𝑖^,)$ 。𝜀 代表精度需求

$𝑥_{𝑖}^{,}$,用拉格朗日法求解梯度，例如

\nabla L (x_{i}, ϕ) = 0 \Leftrightarrow {\begin{cases} \frac{\partial P_{i}}{\partial x_{i, j}} = ϕ, j \in M \\ \sum_{j = 0}^{M} x_{i, j} = 1 \end{cases}

每次迭代寻找最优的$𝑥_{𝑖}^{,}$
根据纳什均衡的特点，只有当成本函数减少时，策略才会更新。当两个策略足够接近时，算法终止。
最后的收敛策略$𝑋^∗$是任务卸载游戏的纳什均衡。

∥ x_{i} - x_{i} ∥ = \sqrt{\sum_{i = 1}^{N} \sum_{j = 0}^{M} {| x_{i, j}^{'} - x_{i, j} |}^{2}} < ε

实验仿真

论文中实验仿真对比的算法为全本地卸载，随机卸载，平均卸载，对比的算法均为最简单的卸载算法，意义不大

具体实验仿真参考论文

论文地址

Wang, Yuxuan, et al. “A game-theoretic approach to computation offloading in satellite edge computing.” IEEE Access 8 (2019): 12510-12520.